Heise 10.12.2025
13:30 Uhr

heise+ | Sechs KI-Videogeneratoren mit Tonspur im Vergleich


OpenAI Sora 2 und Google Veo 3.1 generieren Videos mit Tonspur. Und auch visuell übertreffen sie die Konkurrenz von Adobe, Kling AI und Luma AI deutlich.

heise+ | Sechs KI-Videogeneratoren mit Tonspur im Vergleich

Die Ära der stummen KI-Videos ist Geschichte: Mit OpenAIs Sora 2 und Googles Veo 3.1 treten Dienste an, die nicht nur bewegte Bilder, sondern auch überzeugende Tonspuren versprechen – von kindlichen Erzählstimmen bis hin zu filmreifen Soundeffekten. Auch der chinesische Anbieter Kling AI versieht KI-Videoclips über DeepSeek mit Soundeffekten und Musik, nicht jedoch mit sprechenden Figuren.

Adobe Firefly, Ray3, Luma AI und Runway ML erzeugen weiterhin nur stumme Clips. Wir haben alle sechs Modelle verglichen – drei mit und drei ohne Soundausgabe.

Die Videogeneratoren traten im Test anhand von etwas mehr als zehn Aufgaben gegeneinander an. Die Aufgaben teilen sich in drei Blöcke: kindgerechte Animationen, die einfache Abläufe erklären, die Vorstellung eines technischen Geräts als Produktvideo mit sowie ohne menschlichem Avatar und hollywoodreife Filmszenen für Marketing, Werbung, TV oder Kino.